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GenCore version 6.3 
Copyright (c) 1993 - 2011 Biocceleration Ltd. 



OM nucleic - nucleic search, using sw model 
Run on : 



Title : 

Perfect score: 
Sequence : 

Scoring table: 



January 18, 2011, 09:21:18 ; Search time 572 Seconds 
(without alignments) 
68692.092 Million cell updates/sec 

US-10-591-347-2 
3424 

1 aggatcagaacaatgcctcc taaactagttcatttcaaaa 3424 

I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 21130652 seqs, 5737639395 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq lenqth: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database 



Issued_Patents_NA: * 

/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
/ABSS/Data/CRF/ptodata/1 
10: /ABSS/Data/CRF/ptodata/ 
11: /ABSS/Data/CRF/ptodata/ 
12: /ABSS/Data/CRF/ptodata/ 
13: /ABSS/Data/CRF/ptodata/ 



/ina/l_COMB . seq: * 
/ina/5_COMB . seq: * 
/ina/6A_COMB . seq : * 
/ina/6B_COMB . seq: * 
/ina/7A_COMB. seq: * 
/ina/7B_COMB. seq: * 
/ina/7C_COMB. seq: * 
/ina/7D_COMB. seq: * 
/ina/7E_COMB. seq: * 
l/ina/7F_COMB. seq: 
l/ina/7G_COMB. seq: 
l/ina/7H_COMB. seq: 
l/ina/7I_COMB. seq: 
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/ABSS/Data/CRF/ptodata/l/ina/7J_COMB. seq: * 
/ABSS/Data/CRF/ptodata/l/ina/HA_COMB. seq: * 
/ABSS/Data/CRF/ptodata/l/ina/HB_COMB. seq: * 
/ABSS/Data/CRF/ptodata/l/ina/PCTUS_COMB. seq: 
/ABSS/Data/CRF/ptodata/l/ina/PP_COMB. seq: * 
/ABSS/Data/CRF/ptodata/l/ina/RE_COMB. seq: * 
/ABSS/Data/CRF/ptodata/l/ina/backf ilesl . seq: 
SUMMARIES 



Query 

Match Lenqth DB 



Description 



1 


3407 


2 


99 


5 


3412 


2 


US-08-162-081B-32 


Sequence 32, Appl 


2 


3407 


2 


99 


5 


3412 


2 


US-08-780-872-32 


Sequence 32, Appl 


3 


3407 


2 


99 


5 


3412 


3 


US-09-085-957-32 


Sequence 32, Appl 


4 


3407 


2 


99 


5 


3412 


8 


US-09-325-095-32 


Sequence 32, Appl 


5 


3343 


4 


97 


6 


4300 


11 


US-11-443-428A-73308 


Sequence 73308, A 


6 


3343 


4 


97 


6 


4354 


11 


US-1 1-4 43-42 8A- 733 13 


Sequence 73313, A 


7 


3236 


8 


94 


5 


3240 


2 


US-08-162-081B-34 


Sequence 34, Appl 


8 


3236 


8 


94 


5 


3240 


2 


US-08-780-872-34 


Sequence 34, Appl 


9 


3236 


8 


94 


5 


3240 


3 


US-09-085-957-34 


Sequence 34, Appl 


10 


3236 


8 


94 


5 


3240 


8 


US-09-325-095-34 


Sequence 34, Appl 


11 


3225 


4 


94 


2 


4300 


11 


US-11-443-428A-73309 


Sequence 73309, A 


12 


3008 


6 


87 


9 


3207 


2 


US-08-162-081B-35 


Sequence 35, Appl 


13 


3008 


6 


87 


9 


3207 


2 


US-08-780-872-35 


Sequence 35, Appl 


14 


3008 


6 


87 


9 


3207 


3 


US-09-085-957-35 


Sequence 35, Appl 


15 


3008 


6 


87 


9 


3207 


8 


US-09-325-095-35 


Sequence 35, Appl 


16 


955 


2 


27 


9 


1769 


11 


US-11-443-428A-73314 


Sequence 73314, A 


17 


896 


2 


26 


2 


2560 


11 


US-11-443-428A-73310 


Sequence 73310, A 


18 


564 


16 


5 


741 


5 


US-09-313-292-2181 


Sequence 2181, Ap 


19 


467 


8 


13 


7 


4768 


11 


US-11-443-428A-41044 7 


Sequence 410447, 


20 


460 


8 


13 


5 


3213 


3 


US-09-392-350-1 


Sequence 1, Appli 


21 


460 


8 


13 


5 


3213 


3 


US-09-949-016-5450 


Sequence 5450, Ap 


22 


460 


8 


13 


5 


4103 


11 


US-11-443-428A-410446 


Sequence 410446, 


23 


460 


8 


13 


5 


4765 


11 


US-1 1-4 43-42 8A-4 10 45 4 


Sequence 410454, 


24 


460 


8 


13 


5 


4819 


11 


US-1 1-4 4 3-42 8A-4 10 453 


Sequence 410453, 


25 


460 


8 


13 


5 


4941 


11 


US-11-443-428A-410445 


Sequence 410445, 


26 


419 


2 


12 


2 


4736 


11 


US-11-443-428A-410448 


Sequence 410448, 


27 


384 


8 


11 


2 


3588 


11 


US-11-4 43-428A-410449 


Sequence 410449, 


28 


329 


8 


9 


6 


3387 


3 


US-09-194-640A-2 


Sequence 2, Appli 


29 


329 


8 


9 


6 


3387 


3 


US-1 0-1 6 2-16 0A-2 


Sequence 2, Appli 


30 


329 


8 


9 


6 


3387 


8 


US-11-219-611-2 


Sequence 2, Appli 


31 


329 


8 


9 


6 


3868 


3 


US-09-357-070-1 


Sequence 1, Appli 


32 


329 


8 


9 


6 


3868 


3 


US-09-949-016-709 


Sequence 709, App 


c 33 


329 


8 


9 


6 


5083 


11 


US-11-443-428A-621175 


Sequence 621175, 


34 


329 


8 


9 


6 


5220 


2 


US-08-777-405A-1 


Sequence 1, Appli 


35 


329 


8 


9 


6 


5220 


2 


US-08-977-871A-1 


Sequence 1, Appli 


36 


329 


8 


9 


6 


5220 


2 


US-09-225-951-1 


Sequence 1, Appli 


37 


329 


8 


9 


6 


5220 


3 


US-09-841-341-1 


Sequence 1, Appli 


38 


329 


8 


9 


6 


5220 


3 


US-10-027-591-1 


Sequence 1, Appli 


39 


329 


8 


9 


6 


5220 


3 


US-10-337-192-1 


Sequence 1, Appli 


40 


329 


8 


9 


6 


5220 


3 


US-10-697-912-1 


Sequence 1, Appli 


41 


329 


8 


9 


6 


5220 


9 


US-10-511-937-2856 


Sequence 2856, Ap 


c 42 


329 


8 


9 


6 


6144 


11 


US-11-443-428A-621133 


Sequence 621133, 
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c 43 
c 44 
c 45 



329.8 
329.8 
329.8 



9.6 
9.6 
9.6 



6768 11 US-11-443-428A-621131 
7135 11 US-11-443-428A-621128 
8165 11 US-11-443-428A-621102 



Sequence 621131, 
Sequence 621128, 
Sequence 621102, 



ALIGNMENTS 



RESULT 1 

US-08-162-081B-32 

; Sequence 32, Application US/08162081B 

; Patent No. 5824492 

; GENERAL INFORMATION: 

; APPLICANT: Hiles, Ian Donald; Fry, Michael John; Dhand, Ritu 

; APPLICANT: Bala; Waterfield, Michael Derek; Parker, Peter 

; APPLICANT: Joseph; Otsu, Masayuki; Panayotou, Georqe; Volinia, 

; APPLICANT: Stefano; Gout, Ivan Tarasovitch 

; TITLE OF INVENTION: POLYPEPTIDES HAVING KINASE ACTIVITY, 

; TITLE OF INVENTION: THEIR PREPARATION AND USE 

; NUMBER OF SEQUENCES: 50 

; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: Felfe & Lynch 

; STREET: 805 Third Avenue 

; CITY: New York 

; STATE: New York 

; COUNTRY: USA 

; ZIP: 10022 

; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

; COMPUTER: IBM PS/2 

; OPERATING SYSTEM: PC-DOS 

; SOFTWARE: Wordperfect 

; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US / 0 8 / 16 2 , 0 8 IB 

; FILING DATE: February 7, 1994 

; CLASSIFICATION: 435 

; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: PCT/GB93 / 0 0 76 1 

; FILING DATE: 13 April 1993 

; ATTORNEY/AGENT INFORMATION: 

; NAME: Pasqualini, Patricia A. 

; REGISTRATION NUMBER: 34,894 

; REFERENCE/DOCKET NUMBER: LUD 5256 

; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: (212) 688-9200 

; TELEFAX: (212) 838-3884 

; INFORMATION FOR SEQ ID NO: 32: 

; SEQUENCE CHARACTERISTICS: 

; LENGTH: 3412 base pairs 

; TYPE: nucleic acid 

; STRANDEDNESS : single or double 

; TOPOLOGY: linear 

; FEATURE : 

; NAME /KEY: CDS 
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; LOCATION: 1 . . 3204 

; OTHER INFORMATION: 

US-08-162-081B-32 



/standard_name= "CDS" 



Query Match 99.5%; Score 3407.2; DB 2; 

Best Local Similarity 99.9%; 

Matches 3409; Conservative 0; Mismatches 3; 



Length 3412; 
Indels 0; Gaps 



13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 AC AT TAG T AAC T AT AAAGC AT G AAC T AT T T AAAG AAG C AAG AAAAT AC CCTCTCCAT C AA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACATTAGTAACTATAAAGCATGAACTATTT AAAG AAG CAAGAAAATACCCTCTCCATCAA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAG AAG CAG AAAG GGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 



253 
241 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



312 
300 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 5 4 0 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 



6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 96 0 

9 73 GAAAC AT C T AC AAAAT C C C T T TGGGTTATAAATAGAGC AC T C AGAAT AAAAAT T C T T T GT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 T AC C AT G GAG GAGAAC C C T T AT GT GAC AAT GT GAAC AC T C AAAGAGT AC C T T G T T C C AAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 T AC C AT G GAG GAGAAC C C T TAT GT GAC AAT GT GAAC AC T C AAAGAGT AC C T T G T T C C AAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 
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Qy 1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AAT G AAT T AAG G G AAAAT G AC AAAG AAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 1632 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAAT AT T T AAC AG AT GAC AAAC T T T C T C AG TAT T T AAT T C AGC TAG T AC AG G T C C T AAAA 1920 

1933 TAT G AAC AAT AT T T G GAT AAC T T GC T T GT GAGAT T T T T AC T GAAGAAAG C AT T GAC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TAT G AAC AAT AT T T G GAT AAC TTGCTTGTGAGATTTTTACT GAAGAAAG C AT T GAC T AAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGC AT TT AAAAT CTGAGATGCACAATAAAACAGTT 2052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 C AG GAG AG G AAG GAT G AAAC AC AAAAGGT AC AGAT G AAG TTTTTAGTT GAG C AAAT GAG G 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 C T C AAAG AC AAG AAC AAAGGAGAAAT AT AT GAT GCAGCCATT G AC CTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 T AC AT T C G AAAG AC C C T AGC C T T AGAT AAAAC T GAGC AAGAGG C T T T G GAG TATTTCATG 312 0 
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Qy 



3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 




Db 



3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 



Qy 



3193 AC AAT T AAAC AGC AT GC AT T GAAC T GAAAGAT AAC T GAGAAAAT G AAAG CTCACTCTG G A 3252 




Db 



3181 AC AAT T AAAC AGC AT GC AT T GAAC T GAAAGAT AAC T GAGAAAAT G AAAG CTCACTCTG G A 32 4 0 



Qy 



3253 TTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3312 




Db 



32 41 CACTACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3300 



Qy 



3313 AAT C C AT GAAC AG CAT T AGAT T T AC AGC AAGAAC AGAAAT AAAAT AC TAT AT AAT T T AAA 33 72 




Db 



3301 AAT C C AT GAAC AG CAT TAG AT T T AC AGC AAGAAC AGAAAT AAAAT AC TAT AT AAT T T AAA 336 0 



Qy 



33 73 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 342 4 




Db 



3361 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 3412 
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Query Match 99.5%; Score 3407.2; DB 2; Length 3412; 

Best Local Similarity 99.9%; 

Matches 3409; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 



Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 60 



73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 120 



133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 



193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 



Qy 253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 300 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 



3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 



433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 
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4 93 AGTAGAGC7AATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCC7AAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 5 4 0 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 T T C C T AG AAAAAT AT C C T C T GAG T C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 T G T T T T AC AAT GCCATCTTATTC C AGAC GC AT T T C C AC AGC T AC AC CAT AT AT G AAT G G A 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 T C T GAAAT C AC T GAGC AGGAGAAAGAT T T T C T AT GGAGT C AC AG AC AC T AT T G T G T AAC T 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 
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2113 C AC C T G7AAT AG G C7AAG T C GAGGC AAT GGAAAAGC T CAT T AAC T T AAC T G AC AT T C T C7AAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

24 73 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 C T C AAAG AC AAG AAC AAAG G AG AAAT AT AT GATGCAGCCATT G AC CTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 T T AAT AG T GAT TAG T AAAGGAGC C C AAGAAT GC AC AAAGAC AAG AG AAT T T GAG AG G T T T 2 952 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 TT7AATAGTGATTAGT7AAAGGAGCCC7AAG7AATGCAC7AAAGAC7AAGAG7AATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 AC AAT T AAAC AG CATGCATT G AAC T G AAAG AT AAC T G AG AAAAT G AAAG CTCACTCTG G A 3252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 AC AAT T AAAC AG CATGCATT G AAC T G AAAG AT AAC T GAG AAAAT G AAAG CTCACTCTG G A 32 4 0 

3253 TTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3241 CACTACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3300 

3313 AAT C C AT G AAC AG CAT T AGAT T T AC AGC AAGAAC AGAAAT AAAAT AC TAT AT AAT T T AAA 33 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 AAT C C AT G AAC AG CAT TAG AT T T AC AG C AAGAAC AG AAAT AAAAT AC TAT AT AAT T T AAA 336 0 

33 73 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 342 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3361 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 3412 
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Query Match 99.5%; Score 3407.2; DB 3; Length 3412; 

Best Local Similarity 99.9%; 

Matches 3409; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

Qy 73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

Qy 133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

Qy 193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 5 4 0 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AAT AAT GAC AAGC AGAAGT AT AC T C T GAAAAT C AAC CAT GAC T G T G T G C C AG AAC AAG T A 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 G AAAC AT C T AC AAAAT C C C T T T G GGT T AT AAAT AGAGC AC T C AGAAT AAAAAT T C T T T G T 102 0 
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Qy 1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 1860 

18 73 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 192 0 

1933 TAT G AAC AAT AT T T G GAT AAC T T G C T T GT G AG AT T T T T AC T G AAG AAAG C AT T G AC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TAT G AAC AAT AT T T G GAT AAC T T G C T T GT G AG AT T T T T AC T G AAG AAAG C AT T G AC T AAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 C AG GAG AG G AAG GAT G AAAC AC AAAAGGT AC AGAT G AAG TTTTTAGTT GAG C AAAT GAG G 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 2292 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 2280 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 T T G AAT T G G GAG AAC C C AG AC AT C AT GT C AGAGT T AC T G T T T C AG AAC AAT GAG AT CATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 
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Qy 2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 T AC AT T C G AAAG AC CCTAGCCT T AGAT AAAAC T GAGC AAGAG G C T T T G GAG TATTTCATG 3120 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 AC AAT T AAAC AG CATGCATT G AAC T G AAAG AT AAC T G AG AAAAT G AAAG CTCACTCTG G A 3252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 AC AAT T AAAC AG CATGCATT G AAC T G AAAGAT AAC T GAG AAAAT G AAAG CTCACTCTG G A 32 4 0 

3253 TTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3312 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

32 41 CACTACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3300 

3313 AAT C C AT G AAC AG CAT TAG AT T T AC AGC AAGAAC AGAAAT AAAAT AC TAT AT AAT T T AAA 33 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 AAT C C AT G AAC AG C AT T AG AT T T AC AGC AAGAAC AGAAAT AAAAT AC TAT AT AAT TT AAA 336 0 

33 73 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 342 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3361 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 3412 
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Query Match 99.5%; Score 3407.2; DB 8; Length 3412; 

Best Local Similarity 99.9%; 

Matches 3409; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

y 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
b 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 AC AT TAG T AAC T AT AAAG CAT G AAC T AT T T AAAG AAG C AAG AAAAT AC CCTCTCCAT C AA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 AC AT TAG T AAC T AT AAAGC AT G AAC T AT T T AAAG AAG C AAG AAAAT AC CCTCTCCAT C AA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAG AAG CAG AAAG GGAA 240 

253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 5 4 0 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAAC AT C T AC AAAAT C C C T T TGGGTTATAAATAGAGC AC T C AGAAT AAAAAT T C T T T GT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 T AC C AT G GAG G AGAAC C C T T AT GT GAC AAT GT GAAC AC T C AAAGAG TACCTTGTTC C AAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1200 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 



http s/Scoi . , i ietltem tion ' ppld= 10591 34... 1 18_090621_us-10-591-347-2.mi&ItemType=4&startB} te=0 (21 of 81 12/3/201 1 1:57:02 PM 



SCORE Search Results Details for Application 10591347 and Search Result 20110118_090621_us-10-591-347-2.rni. 



15 73 7AAT G7AAT T7AAG G G AAAAT GAC AAAGAAC AGC T C AAAGC AAT T T C T AC AC GAG AT C C T C T C 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AAT G AAT T AAG G G AAAAT GAC AAAGAAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAAT AT T T AAC AG AT G AC AAAC TTTCTCAGTATT T AAT TCAGCTAGTACAGGTCC T AAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAAT AT T T AAC AG AT GAC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 192 0 

1933 TAT GAAC AAT AT T T G GAT AAC T T GC T T GT GAGAT T T T T AC T G AAG AAAG C AT T GAC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TAT GAAC AAT AT T T G GAT AAC T T GC T T GT GAGAT T T T T AC T GAAGAAAG C AT T GAC T AAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 T T G AAT T G G G AG AAC C C AG AC AT C AT GT C AG AGT T AC T G T T T C AG AAC AAT GAG AT CATC 2400 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGT G AAAG AC GAT G G AC AAC T GT T T C AT AT AGAT T T T G G AC AC T T T T T G GAT C AC 2832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGT G AAAGAC GAT GGAC AAC T GT T T CAT AT AGAT T T T GGAC AC T T T T T G GAT C AC 2820 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TT AAT AGT GAT T AGT AAAGGAGCCCAAGAATGC AC AAAGAC AAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 
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3193 ACAAT TAAACAG CATGCATT GAAC T GAAAGAT AAC T GAGAAAAT GAAAG CTCACTCTGGA 3252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 ACAAT TAAACAG CATGCATT GAAC T GAAAG AT AAC T GAGAAAAT GAAAG CTCACTCTG G A 32 4 0 

3253 TTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3312 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

32 41 CACTACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGCATAGGAATTGCAC 3300 

3313 AAT C C AT GAAC AG CAT TAG AT T T AC AGC AAG AAC AG AAAT AAAAT AC T AT AT AAT T T AAA 33 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 AAT C C AT GAAC AG CAT TAG AT T T AC AGC AAG AAC AG AAAT AAAAT AC TAT AT AAT T T AAA 336 0 

33 73 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 342 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3361 TAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATTTCAAAA 3412 



RESULT 5 

US-11-443-428A-73308 

Sequence 73308, Application US/11443428A 
Patent No. 7745391 
GENERAL INFORMATION: 

APPLICANT: Mintz, Liat 

APPLICANT: Xie, Hanqing 

APPLICANT: Dahari, Dvir 

APPLICANT: Levanon, Erez 

APPLICANT: Freilich, Shiri 

APPLICANT: Beck, Nili 

APPLICANT: Zhu, Wei-Yong 

APPLICANT: Wasserman, Alon 

APPLICANT: Hermesh, Chen 

APPLICANT: Azar, Idit 

APPLICANT: Bernstein, Jeanne 

TITLE OF INVENTION: METHODS AND SYSTEMS USEFUL FOR ANNOTATING BIOMOLECULAR SEQUENCES 
FILE REFERENCE: 02/23929 

CURRENT APPLICATION NUMBER: US / 1 1 / 4 43 , 428A 
CURRENT FILING DATE: 2006-05-31 
NUMBER OF SEQ ID NOS : 1034312 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 73308 

LENGTH: 4300 

TYPE : DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (15) . . (15) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (23) . . (23) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 



http://es/ScoreAccessWeb/GetItem.action?AppId=l(^ 1:57:02 PM 



SCORE Search Results Detail'; for Application 1059134? and Search Result 20110118_090621_us-10-591-347-2.rni. 
LOCATION: (27) . . (27) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (30) . . (30) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (59) . . (59) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (64) . . (64) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (86) . . (86) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (90) . . (90) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (354) . . (354) 

OTHER INFORMATION: n is a, c, g, or t 
US-11-443-428A-73308 

Query Match 97.6%; Score 3343.4; DB 11; Length 4300; 

Best Local Similarity 98.9%; 

Matches 3387; Conservative 0; Mismatches 37; Indels 2; Gaps 2; 

Qy 1 AGGATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 6 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 172 AGAATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 231 

Qy 61 CCCCCAAGAATCCTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 232 CCCCCAAGAATCCTAGTAGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 291 

Qy 121 CTCCGTGAGGCTACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 92 C T C C G T GAG G C T AC AT T AAT AAC C AT AAAGC AT G AAC T AT T T AAAG AAG C AAG AAAAT AC 351 

Qy 181 CCTCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 240 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 352 CCNCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 411 

Qy 241 GCAGAAAGGGAAGAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 412 GCAGAAAGGGAAGAATTTTTTGATGAAACAAGACGACTTTGTGACCTTCGGCTTTTTCAA 4 71 

Qy 301 C C AT T T T T AAAAG T AAT T G AAC C AG T AGGC AAC C G T G AAG AAAAG AT C C T C AAT C G AG AA 36 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 4 72 C C C T T T T T AAAAG T AAT T G AAC C AG T AGGC AAC C G T G AAG AAAAG AT C C T C AAT C G AG AA 531 

361 ATTGGTTTTGCTATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
532 ATTGGTTTTGCTATCGGCATGCCAGTGTGTGAATTTGATATGGTTAAAGATCCAGAAGTA 5 91 

421 CAGGACTTCCGAAGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTT 480 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

5 92 CAGGACTTCCGAAGAAATATTCTGAACGTTTGTAAAGAAGCTGTGGATCTTAGGGACCTC 651 

4 81 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAG 5 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
652 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCTCCAAATGTAGAATCTTCACCAGAA 711 

541 CTGCCAAAGCACATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 
712 TTGCCAAAGCACATATATAATAAATTAGATAAAGGGCAAATAATAGTGGTGATCTGGGTA 7 71 

6 01 ATAGTTTCTC C AAAT AAT G AC AAGC AGAAGT AT AC T C T G AAAAT C AAC CAT G AC T G T G T G 66 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 72 ATAGTTTCTC C AAAT AAT G AC AAG C AG AAGT AT AC T C T G AAAAT C AAC CAT G AC T G T G T A 831 

661 CCAGAACAAGTAATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
832 CCAGAACAAGTAATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCCTCT 891 

721 GAACAATTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
892 GAACAACTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGA 951 

781 TGTGATGAATACTTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
952 TGTGATGAATACTTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGT 1011 

841 ATAATGCTTGGGAGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAA 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1012 ATAATGCTTGGGAGGATGCCCAATTTGATGTTGATGGCTAAAGAAAGCCTTTATTCTCAA 10 71 

901 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 96 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
10 72 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 1131 

961 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATA 102 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1132 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATA 1191 

1021 AAAATTCTTTGTGCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1192 AAAATTCTTTGTGCAACCTACGTGAATGTAAATATTCGAGACATTGATAAGATCTATGTT 1251 

1081 CGAACAGGTATCTACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1252 CGAACAGGTATCTACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTA 1311 
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Qy 1141 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1312 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 13 71 

12 01 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 126 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

13 72 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 1431 

1261 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 132 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1432 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 14 91 

1321 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 92 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 1551 

1381 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1552 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 1611 

14 41 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1612 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 16 71 

1501 AATTGGTCTGTATCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGA 156 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 72 AATTGGTCTGTATCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGA 1731 

1561 C T AG C T AG AG AC AAT G AAT T AAGGGAAAAT GAC AAAGAAC AG C T C AAAG C AAT T T C T AC A 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1732 CTAGCTAGAGACAATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACA 1791 

1621 C GAG AT CCTCTCTCT G AAAT C AC T G AG C AG GAG AAAG AT TTTCTATG GAG T C AC AG AC AC 16 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 92 C GAG AT CCTCTCTCT G AAAT C AC T G AGC AGGAGAAAG AT TTTCTATG GAG T C AC AG AC AC 1851 

1681 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1852 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1911 

1741 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1912 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 19 71 

1801 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
19 72 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 2 031 

1861 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 032 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 2091 

1921 CAGGTCCTAAAATATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAA 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2 092 CAGGTCCTAAAATATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAA 2151 

1981 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2152 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 2211 

2 041 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2212 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 22 71 

2101 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22 72 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 2331 

2161 GACATTCTCAAACAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTT 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2332 GACATTCTCAAACAGGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTT 2391 

2221 GAGCAAATGAGGCGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAAC 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2392 GAGCAAATGAGGCGACCAGATTTCATGGATGCTCTACAGGGCTTTCTGTCTCCTCTAAAC 2 451 

2281 CCTGCTCATCAACTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAA 2340 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 52 CCTGCTCATCAACTAGGAAACCTCAGGCTTGAAGAGTGTCGAATTATGTCCTCTGCAAAA 2511 

2341 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2512 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 25 71 

2401 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 2 46 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 72 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 2631 

2461 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2632 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 2691 

2521 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 25 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 92 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 2 751 

25 81 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 26 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 752 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 2811 

26 41 CTACATCAGTGGCTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTG 2 700 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 812 CTACATCAGTGGCTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTG 28 71 

2 7 01 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 8 72 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2 931 



http s/Scoi , sWel letltem tion ppId=1059134...118_090621_us-10-591-347-2.mi&ItemType=4&startByte=0 (28 of 8112/3/2011 1:57:02 PM 



SCORE Search Results Details for Application 1059134? and Search Result 20110118_090621_us-10-591-347-2.rni. 

Qy 2 761 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 932 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2991 

2 821 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 2880 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 992 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 3051 

2881 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3052 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 3111 

2 941 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3112 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3171 

3001 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 306 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3172 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 3231 

3061 GATGACATTGCATACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTG 312 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3232 GATGACATTGCATACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTG 32 91 

3121 GAG TATTTCAT G AAAC AAAT GAAT GAT GC AC AT CAT GGTGGCTG G AC AAC AAAAAT G GAT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3292 GAGTATTTCATGAAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGAT 3351 

3181 T G GAT C T T C C AC AC AAT T AAAC AG CAT G CAT T GAAC T G- AAAGAT AAC T G AG AAAAT G AA 3239 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3352 TGGATCTTCCACACAATTAAACAGCATGCATTGAACTGAAAAGATAACTGAGAAAATGAA 3411 

32 4 0 AGCTCACTCTGGATTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGC 32 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3412 AGCTCACTCTGGATTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGC 34 71 

3300 ATAGGAATTGCACAATCCATGAACAGCATTAG-ATTTACAGCAAGAACAGAAATAAAATA 335 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
34 72 ATAGGAATTGCACAATCCATGAACAGCATTAGAATTTACAGCAAGAACAGAAATAAAATA 3531 

335 9 C T AT AT AAT T T AAAT AAT GT AAAC GC AAAC AGGGT TT GAT AGC AC TT AAAC TAGTTC ATT 3418 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3532 C T AT AT AAT T T AAAT AAT GT AAAC GC AAAC AG GGT TT GAT AGC AC TT AAAC TAGTTC ATT 35 91 

3419 TCAAAA 3424 

I I I I I I 
3592 TCAAAA 3597 
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; Sequence 73313, Application US/11443428A 
; Patent No. 7745391 
; GENERAL INFORMATION: 
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; APPLICANT: Mintz, Liat 

; APPLICANT: Xie, Hanqing 

; APPLICANT: Dahari, Dvir 

; APPLICANT: Levanon, Erez 

; APPLICANT: Freilich, Shiri 

; APPLICANT: Beck, Nili 

; APPLICANT: Zhu, Wei-Yong 
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; APPLICANT: Hermesh, Chen 

; APPLICANT: Azar, Idit 

; APPLICANT: Bernstein, Jeanne 

; TITLE OF INVENTION: METHODS AND SYSTEMS USEFUL FOR ANNOTATING BIOMOLECULAR SEQUENCES 

; FILE REFERENCE: 02/23929 

; CURRENT APPLICATION NUMBER: US / 1 1 / 4 43 , 428A 

; CURRENT FILING DATE: 2006-05-31 

; NUMBER OF SEQ ID NOS : 1034312 

; SOFTWARE: Patentln version 3.1 

; SEQ ID NO 73313 
; LENGTH: 4354 
; TYPE : DNA 

; ORGANISM: Homo sapiens 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (15) . . (15) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (23) . . (23) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (27) . . (27) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: mi sc_f eature 
; LOCATION: (30) . . (30) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (59) . . (59) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (64) . . (64) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (86) . . (86) 
; OTHER INFORMATION: n is 
; FEATURE : 

; NAME/KEY: misc_f eature 
; LOCATION: (90) . . (90) 
; OTHER INFORMATION: n is 
; FEATURE : 
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a, c, g, or t 



a, c, g, or t 



a, c, g, or t 



a, c, g, or t 
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; NAME /KEY : misc_feature 
; LOCATION: (354) . . (354) 

; OTHER INFORMATION: n is a, c, g, or t 
US-1 1-4 43-42 8A-733 13 

Query Match 97.6%; Score 3343.4; DB 11; Length 4354; 

Best Local Similarity 98.9%; 

Matches 3387; Conservative 0; Mismatches 37; Indels 2; Gaps 2; 

Qy 1 AGGATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 6 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 172 AGAATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 231 

61 CCCCCAAGAATCCTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
232 CCCCCAAGAATCCTAGTAGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 291 

121 CTCCGTGAGGCTACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2 92 CTCCGTGAGGCTACATTAATAACCATAAAGCATGAACTATTTAAAGAAGCAAGAAAATAC 351 

181 CCTCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 240 

II I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
352 CCNCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 411 

241 GCAGAAAGGGAAGAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
412 GCAGAAAGGGAAGAATTTTTTGATGAAACAAGACGACTTTGTGACCTTCGGCTTTTTCAA 4 71 

301 C C AT T T T T AAAAG T AAT T G AAC C AG T AG G C AAC C G T G AAG AAAAG AT C C T C AAT C G AG AA 360 

II I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 72 C C C T T T T T AAAAG T AAT T G AAC C AG T AG GC AAC C G T G AAG AAAAG AT C C T C AAT C G AG AA 531 

361 ATTGGTTTTGCTATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
532 ATTGGTTTTGCTATCGGCATGCCAGTGTGTGAATTTGATATGGTTAAAGATCCAGAAGTA 5 91 

421 CAGGACTTCCGAAGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTT 480 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

5 92 CAGGACTTCCGAAGAAATATTCTGAACGTTTGTAAAGAAGCTGTGGATCTTAGGGACCTC 651 

4 81 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAG 5 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
652 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCTCCAAATGTAGAATCTTCACCAGAA 711 

541 CTGCCAAAGCACATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 
712 TTGCCAAAGCACATATATAATAAATTAGATAAAGGGCAAATAATAGTGGTGATCTGGGTA 7 71 

6 01 ATAGTTTCTCCAAATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTG 66 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 72 ATAGTTTCTCCAAATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTA 831 

661 C C AG AAC AAG T AAT T G C T G AAGC AAT C AGGAAAAAAAC T AGAAGT AT GTTGCTATCATCT 72 0 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 832 CCAGAACAAGTAATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCCTCT 891 

721 GAACAATTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
892 GAACAACTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGA 951 

781 TGTGATGAATACTTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
952 TGTGATGAATACTTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGT 1011 

841 ATAATGCTTGGGAGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAA 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1012 ATAATGCTTGGGAGGATGCCCAATTTGATGTTGATGGCTAAAGAAAGCCTTTATTCTCAA 10 71 

901 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 96 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
10 72 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 1131 

961 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATA 102 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1132 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATA 1191 

1021 AAAATTCTTTGTGCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1192 AAAATTCTTTGTGCAACCTACGTGAATGTAAATATTCGAGACATTGATAAGATCTATGTT 1251 

1081 C G AAC AG GTATCTAC C AT GGAGGAGAAC C C T T AT GT GAC AAT G T G AAC AC T C AAAG AG T A 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 52 CGAACAGGTATCTACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTA 1311 

1141 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1312 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 13 71 

12 01 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 126 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

13 72 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 1431 

1261 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1432 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 14 91 

1321 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 92 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 1551 

1381 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1552 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 1611 

14 41 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 15 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1612 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 16 71 
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15 01 7AAT TGGTCTGTATCCC G AG7AAGC AGGAT T T AGC T AT T C C C AC G C AG G AC T GAG T7AAC AG A 156 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 72 AATTGGTCTGTATCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGA 1731 

1561 CTAGCTAGAGACAATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACA 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1732 CTAGCTAGAGACAATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACA 1791 

1621 C GAG AT CCTCTCTCT G AAAT C AC T G AGC AGGAGAAAGAT TTTCTATG GAG T C AC AG AC AC 16 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 92 C GAG AT CCTCTCTCT G AAAT C AC T G AGC AGGAGAAAGAT TTTCTATG GAG T C AC AG AC AC 1851 

1681 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1740 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1852 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1911 

1741 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1912 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 19 71 

1801 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 186 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
19 72 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 2 031 

1861 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2032 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 2091 

1921 C AG G T C C T AAAAT AT GAAC AAT AT T T GGAT AAC T T GC T T GT GAGAT T T T T AC T GAAGAAA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 092 CAGGTCCTAAAATATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAA 2151 

1981 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2152 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 2211 

2 041 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2212 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 22 71 

2101 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22 72 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 2331 

2161 GACATTCTCAAACAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTT 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2332 GACATTCTCAAACAGGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTT 2391 

2221 GAGCAAATGAGGCGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAAC 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2392 GAGCAAATGAGGCGACCAGATTTCATGGATGCTCTACAGGGCTTTCTGTCTCCTCTAAAC 2 451 

22 81 CCTGCTCATCAACTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAA 234 0 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2452 CCTGCTCATCAACTAGGAAACCTCAGGCTTGAAGAGTGTCGAATTATGTCCTCTGCAAAA 2511 

2341 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 2 4 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2512 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 25 71 

2401 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 2 46 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 72 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 2631 

2461 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2632 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 26 91 

2521 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 25 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 92 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 2 751 

25 81 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 26 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2 752 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 2811 

26 41 CTACATCAGTGGCTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTG 2 700 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2812 CTACATCAGTGGCT C AAAGAC AAGAAC AAAGGAGAAAT AT AT GAT GCAGCCATT G AC C T G 28 71 

2 7 01 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2 76 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
28 72 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2931 

2 761 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 932 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2 991 

2 821 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2992 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 3051 

2881 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3052 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 3111 

2 941 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3112 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3171 

3001 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 306 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3172 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 3231 

3061 GATGACATTGCATACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTG 312 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3232 GAT G AC AT TGCATACATTC GAAAGAC C C T AGC C T T AGAT AAAAC T GAG C AAG AG G C T T T G 32 91 
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Query Match 94.5%; Score 3236.8; DB 2; Length 3240; 

Best Local Similarity 99.9%; 

Matches 3238; Conservative 0; Mismatches 2; Indels 0; Gaps 



Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 



73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 120 



133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 AC AT TAG T AAC T AT AAAGC AT GAAC TAT T T AAAGAAGC AAGAAAAT AC CCTCTCCAT C AA 180 



193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 



253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 300 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 



3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 



Qy 433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 
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Qy 4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAG T C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AAT G AAT T AAG G G AAAAT G AC AAAG AAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 
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Qy 2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

22 93 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2580 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2881 T T AAT AG T GAT TAG T AAAG GAG C C C AAGAAT GC AC AAAGAC AAG AG AAT T T GAG AG G T T T 2940 



Qy 



2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 




Db 



2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 



Qy 



3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 




Db 



3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 



Qy 



30 73 T AC AT T C G AAAG AC C C T AGC C T T AGAT AAAAC T GAGC AAGAGGC T T T G GAG TATTTCATG 3132 




Db 



3061 T AC AT T C G AAAG AC C C T AGC C T T AGAT AAAAC T GAGC AAG AG G C T T T G GAG TATTTCATG 312 0 



Qy 



3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 




Db 



3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 



Qy 



3193 ACAAT T AAAC AG CATGCATT G AAC T GAAAGAT AAC T GAGAAAAT G AAAG CTCACTCTGGA 3252 




Db 



3181 ACAAT T AAAC AG CATGCATT G AAC T GAAAGAT AAC T GAGAAAAT G AAAG CTCACTCTG G A 32 4 0 
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APPLICATION NUMBER: PCT/GB93/00761 

FILING DATE: 13 April 1993 
ATTORNEY/AGENT INFORMATION: 

NAME: Pasqualini, Patricia A. 

REGISTRATION NUMBER: 34,894 

REFERENCE/DOCKET NUMBER: LUD 5256 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 34: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3240 base pairs 

TYPE: nucleic acid 

STRANDEDNESS : single 

TOPOLOGY: linear 
US-08-780-872-34 

Query Match 94.5%; Score 3236.8; DB 2; Length 3240; 

Best Local Similarity 99.9%; 

Matches 3238; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

Qy 73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 120 

Qy 133 AC AT T AGT AAC T AT AAAGC AT GAAC TAT T T AAAGAAGC AAGAAAAT AC CCTCTCCAT C AA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

Qy 193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

Qy 253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 300 

Qy 313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

Qy 3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 

Qy 433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

Qy 4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 AGTAGAGC7AATGTATGTCTATCCGCCACATGTAG7AATCTTCACCAGAGCTGCC7AAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGC AGAAGTATACTCTGAAAATCAACC AT GACTGTGTGCCAGAACAAGT A 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCATGGG G AAAT AT AAAC T T GT T T GAT T AC AC AGAC AC TCTAGTATCTG G AAAA 132 0 
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1333 ATGGCTTTG7AATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG7AACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AAT G AAT T AAG G G AAAAT G AC AAAG AAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 

2113 C AC C T G AAT AG G C AAG T C GAGGC AAT GGAAAAGC T CAT T AAC T T AAC T G AC AT T C T C AAA 2172 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22 81 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 234 0 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2580 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 T T AAT AG T GAT TAG T AAAGGAGC C C AAGAAT GC AC AAAGAC AAG AG AAT T T GAG AG G T T T 2940 
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Qy 



2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 




Db 



2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 



Qy 



3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 




Db 



3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 



Qy 



30 73 T AC AT T C G AAAG AC C C T AGC C T T AGAT AAAAC T GAGC AAGAGGC T T T G GAG TATTTCATG 3132 




Db 



3061 T AC AT T C G AAAG AC C C T AGC C T T AGAT AAAAC T GAGC AAG AG G C T T T G GAG TATTTCATG 312 0 



Qy 



3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 




Db 



3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 



Qy 



3193 ACAAT T AAAC AG CATGCATT G AAC T GAAAGAT AAC T G AG AAAAT G AAAG CTCACTCTGGA 3252 




Db 



3181 ACAATTAAACAGCATGCATTGAACTGAAAGATAACTGAGAAAATGAAAGCTCACTCTGGA 32 4 0 
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Query Match 94.5%; Score 3236.8; DB 3; Length 3240; 

Best Local Similarity 99.9%; 

Matches 3238; Conservative 0; Mismatches 2; Indels 0; Gaps 



Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 



73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 120 



133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 AC AT TAG T AAC T AT AAAGC AT GAAC TAT T T AAAGAAGC AAGAAAAT AC CCTCTCCAT C AA 180 



193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 



253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 300 



313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 



3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 



Qy 433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 
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Qy 4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAG T C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AAT G AAT T AAG G G AAAAT G AC AAAG AAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 
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Qy 2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

22 93 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2592 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 2580 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 2881 T T7AAT AG T GAT TAG T7AAAG GAG C C C AAGAAT GC AC AAAGAC AAG AG7AAT T T GAG AG G T T T 2940 



Qy 



2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 




Db 



2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 



Qy 



3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 




Db 



3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 



Qy 



30 73 T AC AT T C G AAAGAC C C T AGC C T T AGAT AAAAC T GAGC AAGAGGC T T T G GAG TATTTCATG 3132 




Db 



3061 T AC AT T C G AAAGAC C C T AGC C T T AGAT AAAAC T GAGC AAG AG G C T T T G GAG TATTTCATG 312 0 



Qy 



3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 




Db 



3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 



Qy 



3193 ACAAT T AAAC AG CATGCATT G AAC T GAAAGAT AAC T GAGAAAAT GAAAG CTCACTCTGGA 3252 




Db 



3181 ACAAT T AAAC AG CATGCATT G AAC T GAAAGAT AAC T GAGAAAAT GAAAG CTCACTCTG G A 32 4 0 



RESULT 10 
US-09-325-095-34 

; Sequence 34, Application US/09325095 

; Patent No. 7422849 

; GENERAL INFORMATION: 

; APPLICANT: Hiles, Ian Donald; Fry, Michael John; Dhand, Ritu 

; APPLICANT: Bala; Waterfield, Michael Derek; Parker, Peter 

; APPLICANT: Joseph; Otsu, Masayuki; Panayotou, George; Volinia, 

; APPLICANT: Stefano; Gout, Ivan Tarasovitch 

; TITLE OF INVENTION: POLYPEPTIDES HAVING KINASE ACTIVITY, 

; TITLE OF INVENTION: THEIR PREPARATION AND USE 

; NUMBER OF SEQUENCES: 50 

; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: Felfe & Lynch 

; STREET: 805 Third Avenue 

; CITY: New York 

; STATE: New York 

; COUNTRY: USA 

; ZIP: 10022 

; COMPUTER READABLE FORM: 

; MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

; COMPUTER: IBM PS/2 

; OPERATING SYSTEM: PC-DOS 

; SOFTWARE: Wordperfect 

; CURRENT APPLICATION DATA: 

; APPLICATION NUMBER: US/09/325,095 

; FILING DATE: 

; CLASSIFICATION: 

; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: 09/085,957 

; FILING DATE: 



http://es/ScoreAccessWeb/Getttem.action?AppM 1:57:02 PM 



SCORE Search Results Detail'; for Application 1059134? and Search Result 20110118_090621 us-10-591-347-2.rni. 

APPLICATION NUMBER: 08/780,872 

FILING DATE: 09-JAN-1997 

APPLICATION NUMBER: 08/162,081 

FILING DATE: February 7, 1994 

APPLICATION NUMBER: PCT/GB93/00761 

FILING DATE: 13 April 1993 
ATTORNEY/AGENT INFORMATION: 

NAME: Pasqualini, Patricia A. 

REGISTRATION NUMBER: 34,894 

REFERENCE/DOCKET NUMBER: LUD 5256 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 34: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3240 base pairs 

TYPE: nucleic acid 

STRANDEDNESS : single 

TOPOLOGY: linear 
US-09-325-095-34 

Query Match 94.5%; Score 3236.8; DB 8; Length 3240; 

Best Local Similarity 99.9%; 

Matches 3238; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

Qy 73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

Qy 133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AT TAG T AAC T AT AAAG CAT G AAC TAT T T AAAGAAGC AAG AAAAT AC CCTCTCCAT C AA 180 

Qy 193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

Qy 253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 300 

Qy 313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

Qy 3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 42 0 

Qy 433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AG7AAATATTCTT7AATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTT7AATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 5 4 0 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAGT C AGT AT AAGT AT AT AAGAAGC T G T AT AAT G C T T G G G 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 900 

913 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 T G T T T T AC AAT GCCATCTTATTC C AG AC GC AT TTCCACAGCTACACCATATAT G AAT G G A 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 
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12 73 CCATTGGCATGGG G7AAAT AT AAAC T T GT T T GAT T AC AC AGAC AC TCTAGTATCTG G7AA7AA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AAT G AAT T AAG G G AAAAT G AC AAAG AAC AGC T C AAAG C AAT TTCTACAC GAG AT C C T C T C 162 0 

1633 T C T GAAAT C AC T GAG C AG GAG AAAG AT T T T C T AT GGAGT C AC AG AC AC T AT T G T G T AAC T 16 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 T C T GAAAT C AC T GAG C AG GAG AAAG AT T T T C TAT GGAGT C AC AGAC AC T AT T G T G T AAC T 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 186 0 

18 73 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AT T T AAT TCAGCTAGTACAGGTCC T AAAA 1932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 



http s/ScoreAc ft'el ietll i ion ppId=1059134...118_090621_us-10-591-347-2.mi&ItemType=4&startByte=0 (53 of 81)2/3/2011 1:57:02 PM 



SCORE Search Results Detail'; for Application 1059134? and Search Result 20110118_090621_us-10-591-347-2.rni. 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 246 0 

24 73 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2520 

2 533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 41 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2 833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2880 
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2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 AC AAT T AAAC AG CATGCATT G AAC T G AAAG AT AAC T G AG AAAAT G AAAG CTCACTCTG G A 3252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 AC AAT T AAAC AG C AT GC AT T GAAC T GAAAGAT AAC T GAGAAAAT G AAAG CTCACTCTG G A 32 4 0 
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LOCATION: (15) . . (15) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (23) . . (23) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (27) . . (27) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (30) . . (30) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (59) . . (59) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (64) . . (64) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (86) . . (86) 

OTHER INFORMATION: n is a, C, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (90) . . (90) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE : 

NAME/KEY: misc_f eature 
LOCATION: (354) . . (354) 

OTHER INFORMATION: n is a, c, g, or t 
US-11-443-428A-73309 

Query Match 94.2%; Score 3225.4; DB 11; Length 4300; 

Best Local Similarity 97.3%; 

Matches 3333; Conservative 0; Mismatches 37; Indels 56; Gaps 3; 

Qy 1 AGGATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 6 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 172 AGAATCAGAACAATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATG 231 

Qy 61 CCCCCAAGAATCCTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 232 CCCCCAAGAATCCTAGTAGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGC 291 

Qy 121 CTCCGTGAGGCTACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 92 CTCCGTGAGGCTACATTAATAACCATAAAGCATGAACTATTTAAAGAAGCAAGAAAATAC 351 

Qy 181 CCTCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 240 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 352 CCNCTCCATCAACTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAA 411 

241 GCAGAAAGGGAAGAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAA 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



301 CCATTTTTAAAAGTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAA 36 0 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 72 C C C T T T T T AAAAG T AAT T G AAC C AGT AGGC AAC C GT GAAG AAAAG AT C C T C AAT C G AG AA 531 

361 ATTGGTTTTGCTATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

532 ATTGGTTTTGCTATCGGCATGCCAGTGTGTGAATTTGATATGGTTAAAGATCCAGAAGTA 5 91 

421 CAGGACTTCCGAAGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTT 480 
I I I I I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I II 

5 92 CAGGACTTCCGAAGAAATATTCTGAACGTTTGTAAAGAAGCTGTGGATCTTAGGGACCTC 651 

4 81 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAG 5 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 

652 AATTCACCTCATAGTAGAGCAATGTATGTCTATCCTCCAAATGTAGAATCTTCACCAGAA 711 

541 CTGCCAAAGCACATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTA 6 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I III I I I I I I I I I I I I I I I I I I I I I I I 

712 TTGCCAAAGCACATATATAATAAATTAGATAAAGGGCAAATAATAGTGGTGATCTGGGTA 7 71 

6 01 ATAGTTTCTC C AAAT AAT GAC AAGC AGAAGT AT AC T C T GAAAAT C AAC CAT G AC T G T G T G 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 72 ATAGTTTCTC C AAAT AAT GAC AAGC AGAAGT AT AC T C T GAAAAT C AAC CAT GAC T G T G T A 831 

661 CCAGAACAAGTAATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

832 CCAGAACAAGTAATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCCTCT 891 

721 GAACAATTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

892 GAACAACTAAAACTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGA 951 

781 TGTGATGAATACTTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGT 840 

I I I I I I I I I I I I I I I I I I I I 

952 T G T GAT G AAT AC T T C C TAG A 9 71 

841 ATAATGCTTGGGAGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

9 72 GATGCCCAATTTGATGTTGATGGCTAAAGAAAGCCTTTATTCTCAA 1017 

901 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 96 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1018 CTGCCAATGGACTGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCA 10 7 7 

961 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATA 102 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

10 78 TATATGAATGGAGAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATA 113 7 
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Qy 1021 AAAATTCTTTGTGCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1138 AAAAT TCTTTGTG C AAC C T AC G T G AAT GT AAAT AT T C GAG AC AT T G AT AAG AT C T AT G T T 119 7 

1081 CGAACAGGTATCTACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1198 CGAACAGGTATCTACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTA 125 7 

1141 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
125 8 CCTTGTTCCAATCCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTT 1317 

12 01 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 126 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1318 CCTCGTGCTGCTCGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAA 13 7 7 

1261 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 132 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

13 7 8 GAGGAACACTGTCCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTA 143 7 

1321 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1438 GTATCTGGAAAAATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTG 14 9 7 

1381 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1498 AACCCTATTGGTGTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAG 155 7 

14 41 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 1500 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1558 TTTGACTGGTTCAGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCC 1617 

15 01 AATTGGTCTGTATCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGA 156 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1618 AATTGGTCTGTATCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGA 16 7 7 

1561 CTAGCTAGAGACAATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACA 162 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 7 8 CTAGCTAGAGACAATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACA 173 7 

1621 C GAG AT CCTCTCTCT G AAAT C AC T G AGC AGGAG AAAG AT TTTCTATG GAG T C AC AG AC AC 16 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1738 C GAG AT CCTCTCTCT G AAAT C AC T G AGC AGGAGAAAG AT TTTCTATG GAG T C AC AG AC AC 17 9 7 

1681 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1798 TATTGTGTAACTATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCT 1857 

1741 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
185 8 AGAGATGAAGTAGCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAA 1917 

1801 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 186 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1918 CAGGCTATGGAACTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTT 19 7 7 

1861 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
19 78 CGGTGCTTGGAAAAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTA 2 03 7 

1921 CAGGTCCTAAAATATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAA 1980 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 038 CAGGTCCTAAAATATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAA 209 7 

1981 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 098 GCATTGACTAATCAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCAC 215 7 

2 041 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
215 8 AATAAAACAGTTAGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGG 2217 

2101 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 216 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2218 ATGTATTTGAAGCACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACT 22 7 7 

2161 GACATTCTCAAACAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTT 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
22 7 8 G AC AT T C T C AAAC AG GAGAAGAAGGAT GAAAC AC AAAAGGT AC AG AT G AAG TTTTTAGTT 233 7 

2221 GAGCAAATGAGGCGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAAC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2338 GAGCAAATGAGGCGACCAGATTTCATGGATGCTCTACAGGGCTTTCTGTCTCCTCTAAAC 239 7 

2281 CCTGCTCATCAACTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2398 CCTGCTCATCAACTAGGAAACCTCAGGCTTGAAGAGTGTCGAATTATGTCCTCTGCAAAA 2 45 7 

2341 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 2 4 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 45 8 AGGCCACTGTGGTTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAAC 2517 

2401 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 2 46 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2518 AATGAGATCATCTTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATT 25 7 7 

2 461 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2578 ATTCGTATTATGGAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTAT 2637 

2521 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 25 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2638 GGTTGTCTGTCAATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACT 26 9 7 

25 81 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 26 4 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

26 98 ATTATGCAAATTCAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACA 2 75 7 
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Qy 26 41 CTACATCAGTGGCTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTG 2 700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 75 8 CTACATCAGTGGCTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTG 2817 

2 7 01 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2 76 0 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 818 TTTACACGTTCATGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGT 2 8 7 7 

2 761 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2 82 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 8 7 8 CACAATAGTAACATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACAC 2 93 7 

2 821 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2938 TTTTTGGATCACAAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTG 2997 

2881 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2998 ACACAGGATTTCTTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAA 305 7 

2 941 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
305 8 TTTGAGAGGTTTCAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAAT 3117 

3001 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 306 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3118 CTCTTCATAAATCTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTT 317 7 

3061 GAT G AC AT TGCATACATTC GAAAGAC C C T AGC C T T AGAT AAAAC T GAG C AAG AG G C T T T G 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
317 8 GATGACATTGCATACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTG 323 7 

3121 GAGTATTTCATGAAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGAT 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3238 GAGTATTTCATGAAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGAT 32 9 7 

3181 TGGATCTTCCACACAATTAAACAGCATGCATTGAACTG-AAAGATAACTGAGAAAATGAA 3239 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
32 98 T G GAT C T T C C AC AC AAT T AAAC AG CAT G CAT T G AAC T G AAAAG AT AAC T G AG AAAAT G AA 335 7 

32 4 0 AGCTCACTCTGGATTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGC 32 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
335 8 AGCTCACTCTGGATTCCACACTGCACTGTTAATAACTCTCAGCAGGCAAAGACCGATTGC 3417 

3300 ATAGGAATTGCACAATCCATGAACAGCATTAG-ATTTACAGCAAGAACAGAAATAAAATA 335 8 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3418 ATAGGAATTGCACAATCCATGAACAGCATTAGAATTTACAGCAAGAACAGAAATAAAATA 34 7 7 

335 9 CTATATAATTTAAATAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATT 3418 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
34 78 CTATATAATTTAAATAATGTAAACGCAAACAGGGTTTGATAGCACTTAAACTAGTTCATT 353 7 

3419 TCAAAA 3424 
I I I I I I 
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Db 3538 TCAAAA 3543 



RESULT 12 
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APPLICANT: Bala; Waterfield, Michael Derek; Parker, Peter 
APPLICANT: Joseph; Otsu, Masayuki; Panayotou, George; Volinia, 
APPLICANT: Stefano; Gout, Ivan Tarasovitch 

TITLE OF INVENTION: POLYPEPTIDES HAVING KINASE ACTIVITY, 
TITLE OF INVENTION: THEIR PREPARATION AND USE 
NUMBER OF SEQUENCES: 50 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Felfe & Lynch 

STREET: 805 Third Avenue 

CITY: New York 

STATE: New York 

COUNTRY: USA 

ZIP: 10022 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette, 5.25 inch, 360 kb storage 

COMPUTER: IBM PS/2 

OPERATING SYSTEM: PC-DOS 

SOFTWARE: Wordperfect 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/162, 081B 

FILING DATE: February 7, 1994 

CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/GB93/00761 

FILING DATE: 13 April 1993 
ATTORNEY/AGENT INFORMATION: 

NAME: Pasqualini, Patricia A. 

REGISTRATION NUMBER: 34,894 

REFERENCE/DOCKET NUMBER: LUD 5256 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (212) 688-9200 

TELEFAX: (212) 838-3884 
INFORMATION FOR SEQ ID NO: 35: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3207 base pairs 

TYPE: nucleic acid 

STRANDEDNESS : single 

TOPOLOGY: linear 
US-08-162-081B-35 

Query Match 87.9%; Score 3008.6; DB 2; Length 3207; 

Best Local Similarity 96.1%; 

Matches 3083; Conservative 0; Mismatches 124; Indels 0; Gaps 
Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTAGAATGTTTACTACCAAATGGGATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACGTTAATAACGATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GAATTTTTTGATGAAACAAGACGACTTTGTGACCTTCGGCTTTTTCAACCCTTTTTAAAA 300 

313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 ATCGGCATGCCAGTGTGTGAATTCGATATGGTTAAAGATCCAGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTCAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 
I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 AGTAGAGCAATGTATGTTTATCCTCCAAATGTAGAATCTTCACCAGAACTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAAAGGGCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAACAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCATCTGAACAACTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAGT C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 
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853 AGGATGCCC7AATTTG7AAGATGATGGCTAAAGAAAGCCTTTATTCTC7AACTGCC7AATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGATGCTGATGGCTAAAGAAAGCCTCTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCATATTCCAGACGCATCTCCACAGCTACGCCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGATAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTACGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGTTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 126 0 

12 73 CCATTGGCAT G GGGAAAT AT AAAC T T GT T T GAT T AC AC AGAC AC T C TAG T AT C T G G AAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCCTGGGGAAATATAAACTTGTTTGATTACACAGATACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGACTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGTTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTTCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGTGAAGCAGGATTTAGTTATTCCCATGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AATGAATTAAGAGAAAATGATAAAGAACAGCTCCGAGCAATTTGTACACGAGATCCTCTA 162 0 

1633 T C T G AAAT C AC T GAG C AGGAGAAAGAT T T T C T AT GGAGT C AC AG AC AC T AT T G T G T AAC T 16 92 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 TCTGAAATCACTGAGCAAGAGAAAGATTTTCTGTGGAGCCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAACTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 41 GCTCAGATGTACTGCTTGGTAAAAGATTGGCCTCCAATCAAGCCTGAACAGGCTATGGAG 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 
1801 CTTCTGGACTGCAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTAGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AC C T AAT TCAGCTAGTACAGGTAC T AAAA 192 0 

1933 TAT G AAC AAT AT T T G GAT AAC T T G C T T GT G AG AT T T T T AC T G AAG AAAG C AT T G AC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I II I I I I I I 
1921 TATGAACAGTATTTGGATAACCTGCTTGTGAGATTTTTACTCAAAAAAGCGTTAACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATCGGTCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGTCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGCCGTGCATGTGGGATGTATCTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTTAATAGGCAAGTTGAGGCTATGGAAAAGCTCATTAACTTGACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2161 CAAGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGCGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCTCTCCAGGGCTTTCTGTCTCCTCTAAACCCTGCTCATCAG 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTGGGAAATCTCAGGCTTGAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 T T G AAT T G G GAG AAC C C AG AC AT C AT GT C AGAAT TACTCTTT C AG AAC AAT GAG AT CATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 4 01 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACCCTTCAGATTATTCGCATTATG 2 46 0 
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2 4 73 G7AA7AATATCTGGC7AA7AATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGATGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2521 ATCGGTGACTGTGTGGGACTTATCGAGGTGGTGAGAAATTCTCACACTATAATGCAGATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGTAAAGGAGGCCTGAAAGGTGCACTGCAGTTTAACAGCCACACACTCCATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 

26 41 CTCAAAGACAAGAACAAGGGGGAAATATATGATGCGGCCATCGATTTGTTTACACGATCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATATTGTGTTGCCACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAT 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTTAAAGATGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 AAGAAGAAAAAATTTGGTTATAAACGAGAGCGCGTGCCGTTTGTTTTGACACAAGATTTC 2880 

2893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGGCAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTGCAATCTTTTGATGATATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCTTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACACCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 ACAATTAAACAGCATGCATTGAACTGA 3219 

I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 ACAATTAAGCAGCATGCTTTGAACTGA 3207 
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Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTAGAATGTTTACTACCAAATGGGATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACGTTAATAACGATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 ATCGGCATGCCAGTGTGTGAATTCGATATGGTTAAAGATCCAGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTCAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 
I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 AGTAGAGCAATGTATGTTTATCCTCCAAATGTAGAATCTTCACCAGAACTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAAAGGGCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAACAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCATCTGAACAACTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAGT C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 
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Qy 853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 AGGATGCCCAATTTGATGCTGATGGCTAAAGAAAGCCTCTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCATATTCCAGACGCATCTCCACAGCTACGCCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGATAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTACGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGTTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 126 0 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCCTGGGGAAATATAAACTTGTTTGATTACACAGATACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGACTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGTTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTTCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGTGAAGCAGGATTTAGTTATTCCCATGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AATGAATTAAGAGAAAATGATAAAGAACAGCTCCGAGCAATTTGTACACGAGATCCTCTA 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1621 TCTGAAATCACTGAGCAAGAGAAAGATTTTCTGTGGAGCCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAACTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 41 GCTCAGATGTACTGCTTGGTAAAAGATTGGCCTCCAATCAAGCCTGAACAGGCTATGGAG 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1801 CTTCTGGACTGCAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTAGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AC C T AAT TCAGCTAGTACAGGTAC T AAAA 192 0 

1933 TAT G AAC AAT AT T T G GAT AAC T T G C T T GT GAG AT T T T T AC T G AAG AAAG C AT T G AC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I 
1921 TATGAACAGTATTTGGATAACCTGCTTGTGAGATTTTTACTCAAAAAAGCGTTAACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATCGGTCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGTCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGCCGTGCATGTGGGATGTATCTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTTAATAGGCAAGTTGAGGCTATGGAAAAGCTCATTAACTTGACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

II I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2161 CAAGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGCGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCTCTCCAGGGCTTTCTGTCTCCTCTAAACCCTGCTCATCAG 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTGGGAAATCTCAGGCTTGAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAATTACTCTTTCAGAACAATGAGATCATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 4 01 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACCCTTCAGATTATTCGCATTATG 2 46 0 
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Qy 2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGATGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I III 
2521 ATCGGTGACTGTGTGGGACTTATCGAGGTGGTGAGAAATTCTCACACTATAATGCAGATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGTAAAGGAGGCCTGAAAGGTGCACTGCAGTTTAACAGCCACACACTCCATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 

26 41 CTCAAAGACAAGAACAAGGGGGAAATATATGATGCGGCCATCGATTTGTTTACACGATCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATATTGTGTTGCCACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAT 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTTAAAGATGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2 892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mill I I I I I I I I I I I I I I I I I I I I 
2821 AAGAAGAAAAAATTTGGTTATAAACGAGAGCGCGTGCCGTTTGTTTTGACACAAGATTTC 2880 

2893 T T AAT AG T GAT T AGT AAAGGAGC C C AAGAAT GC AC AAAGAC AAGAGAAT T T GAG AG G T T T 2952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 T T AAT AG T GAT TAG T AAAG GAG C C C AAGAAT GC AC AAAGAC AAGAGAAT T T GAG AG G T T T 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGGCAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTGCAATCTTTTGATGATATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCTTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACACCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 ACAATTAAACAGCATGCATTGAACTGA 3219 

I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 ACAATTAAGCAGCATGCTTTGAACTGA 3207 



RESULT 14 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTAGAATGTTTACTACCAAATGGGATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACGTTAATAACGATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GAATTTTTTGATGAAACAAGACGACTTTGTGACCTTCGGCTTTTTCAACCCTTTTTAAAA 300 

313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 ATCGGCATGCCAGTGTGTGAATTCGATATGGTTAAAGATCCAGAAGTACAGGACTTCCGA 42 0 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTCAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 
I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 AGTAGAGCAATGTATGTTTATCCTCCAAATGTAGAATCTTCACCAGAACTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAAAGGGCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAACAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 ATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCATCTGAACAACTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGATGTGATGAATAC 780 

7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 T T C C T AG AAAAAT AT C C T C T GAGT C AGT AT AAGT AT AT AAG AAG C T G T AT AAT G C T T G G G 840 
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853 AGGATGCCC7AATTTG7AAGATGATGGCTAAAGAAAGCCTTTATTCTC7AACTGCC7AATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGATGCTGATGGCTAAAGAAAGCCTCTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCATATTCCAGACGCATCTCCACAGCTACGCCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGATAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTACGATATATACATTCCTGATCTTCCTCGTGCTGCT 12 00 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1272 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGTTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 126 0 

12 73 CCATTGGCAT G GGGAAAT AT AAAC T T GT T T GAT T AC AC AGAC AC T C TAG T AT C T G G AAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCCTGGGGAAATATAAACTTGTTTGATTACACAGATACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGACTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGTTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTTCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGTGAAGCAGGATTTAGTTATTCCCATGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 AATGAATTAAGAGAAAATGATAAAGAACAGCTCCGAGCAATTTGTACACGAGATCCTCTA 162 0 

1633 T C T G AAAT C AC T GAG C AGGAGAAAGAT T T T C T AT GGAGT C AC AG AC AC T AT T G T G T AAC T 16 92 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 TCTGAAATCACTGAGCAAGAGAAAGATTTTCTGTGGAGCCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

16 81 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAACTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 41 GCTCAGATGTACTGCTTGGTAAAAGATTGGCCTCCAATCAAGCCTGAACAGGCTATGGAG 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III 
1801 CTTCTGGACTGCAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTAGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 AAAT AT T T AAC AG AT G AC AAAC T T T C T C AGT AC C T AAT TCAGCTAGTACAGGTAC T AAAA 192 0 

1933 TAT G AAC AAT AT T T G GAT AAC T T G C T T GT G AG AT T T T T AC T G AAG AAAG C AT T G AC T AAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I II I I I I I I 
1921 TATGAACAGTATTTGGATAACCTGCTTGTGAGATTTTTACTCAAAAAAGCGTTAACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2 052 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATCGGTCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 AGTCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGCCGTGCATGTGGGATGTATCTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTTAATAGGCAAGTTGAGGCTATGGAAAAGCTCATTAACTTGACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2161 CAAGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGCGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCTCTCCAGGGCTTTCTGTCTCCTCTAAACCCTGCTCATCAG 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTGGGAAATCTCAGGCTTGAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 T T G AAT T G G GAG AAC C C AG AC AT C AT GT C AGAAT TACTCTTT C AG AAC AAT GAG AT CATC 2 4 00 

2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 4 01 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACCCTTCAGATTATTCGCATTATG 2 46 0 
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2 4 73 G7AA7AATATCTGGC7AA7AATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGATGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2521 ATCGGTGACTGTGTGGGACTTATCGAGGTGGTGAGAAATTCTCACACTATAATGCAGATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGTAAAGGAGGCCTGAAAGGTGCACTGCAGTTTAACAGCCACACACTCCATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 

26 41 CTCAAAGACAAGAACAAGGGGGAAATATATGATGCGGCCATCGATTTGTTTACACGATCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATATTGTGTTGCCACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAT 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGTTAAAGATGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 82 0 

2833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 AAGAAGAAAAAATTTGGTTATAAACGAGAGCGCGTGCCGTTTGTTTTGACACAAGATTTC 2880 

2893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGGCAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTGCAATCTTTTGATGATATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCTTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACACCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 ACAATTAAACAGCATGCATTGAACTGA 3219 

I I I I I I I I I I I I I I I I I I I I I I I I I 
3181 ACAATTAAGCAGCATGCTTTGAACTGA 3207 
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Matches 3083; Conservative 0; Mismatches 124; Indels 0; Gaps 0; 

Qy 13 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGCCTCCAAGACCATCATCAGGTGAACTGTGGGGCATCCACTTGATGCCCCCAAGAATC 6 0 

73 CTAGTGGAATGTTTACTACCAAATGGAATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 132 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CTAGTAGAATGTTTACTACCAAATGGGATGATAGTGACTTTAGAATGCCTCCGTGAGGCT 12 0 

133 ACATTAGTAACTATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 192 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACGTTAATAACGATAAAGCATGAACTATTTAAAGAAGCAAGAAAATACCCTCTCCATCAA 180 

193 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 252 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTTCTTCAAGATGAATCTTCTTACATTTTCGTAAGTGTTACCCAAGAAGCAGAAAGGGAA 240 

253 GAATTTTTTGATGAAACAAGACGACTTTGTGATCTTCGGCTTTTTCAACCATTTTTAAAA 312 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 GAATTTTTTGATGAAACAAGACGACTTTGTGACCTTCGGCTTTTTCAACCCTTTTTAAAA 300 

313 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 3 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 GTAATTGAACCAGTAGGCAACCGTGAAGAAAAGATCCTCAATCGAGAAATTGGTTTTGCT 36 0 

3 73 ATCGGCATGCCAGTGTGCGAATTTGATATGGTTAAAGATCCTGAAGTACAGGACTTCCGA 432 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 ATCGGCATGCCAGTGTGTGAATTCGATATGGTTAAAGATCCAGAAGTACAGGACTTCCGA 420 

433 AGAAATATTCTTAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 4 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 AGAAATATTCTCAATGTTTGTAAAGAAGCTGTGGATCTTAGGGATCTTAATTCACCTCAT 480 

4 93 AGTAGAGCAATGTATGTCTATCCGCCACATGTAGAATCTTCACCAGAGCTGCCAAAGCAC 552 
I I I I I I I I I I I I I I I I I I I I I I III I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 AGTAGAGCAATGTATGTTTATCCTCCAAATGTAGAATCTTCACCAGAACTGCCAAAGCAC 540 

553 ATATATAATAAATTGGATAGAGGCCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 612 

I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATATATAATAAATTGGATAAAGGGCAAATAATAGTGGTGATTTGGGTAATAGTTTCTCCA 6 00 

613 AATAATGACAAGCAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 6 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AATAATGACAAACAGAAGTATACTCTGAAAATCAACCATGACTGTGTGCCAGAACAAGTA 66 0 

6 73 ATTGCTGAAGCAATCAGGAAAAAAACTAGAAGTATGTTGCTATCATCTGAACAATTAAAA 732 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 ATTGCTGAAGCAATCAGGAAAAAAACTCGAAGTATGTTGCTATCATCTGAACAACTAAAA 72 0 

733 CTCTGTGTTTTAGAATATCAGGGCAAGTACATTTTAAAAGTGTGTGGATGTGATGAATAC 7 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CTCTGTGTTTTAGAATATCAGGGCAAGTATATTTTAAAAGTGTGTGGATGTGATGAATAC 780 
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Qy 7 93 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 TTCCTAGAAAAATATCCTCTGAGTCAGTATAAGTATATAAGAAGCTGTATAATGCTTGGG 840 

853 AGGATGCCCAATTTGAAGATGATGGCTAAAGAAAGCCTTTATTCTCAACTGCCAATGGAC 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 AGGATGCCCAATTTGATGCTGATGGCTAAAGAAAGCCTCTATTCTCAACTGCCAATGGAC 900 

913 TGTTTTACAATGCCATCTTATTCCAGACGCATTTCCACAGCTACACCATATATGAATGGA 9 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 TGTTTTACAATGCCATCATATTCCAGACGCATCTCCACAGCTACGCCATATATGAATGGA 96 0 

9 73 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGAGCACTCAGAATAAAAATTCTTTGT 1032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 GAAACATCTACAAAATCCCTTTGGGTTATAAATAGTGCACTCAGAATAAAAATTCTTTGT 102 0 

1033 GCAACCTACGTGAATCTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1092 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 GCAACCTATGTGAATGTAAATATTCGAGACATTGACAAGATTTATGTTCGAACAGGTATC 1080 

1093 TACCATGGAGGAGAACCCTTATGTGACAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 1152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 TACCATGGAGGAGAACCCTTATGTGATAATGTGAACACTCAAAGAGTACCTTGTTCCAAT 114 0 

1153 CCCAGGTGGAATGAATGGCTGAATTATGATATATACATTCCTGATCTTCCTCGTGCTGCT 1212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 CCCAGGTGGAATGAATGGCTGAATTACGATATATACATTCCTGATCTTCCTCGTGCTGCT 1200 

1213 CGACTTTGCCTTTCCATTTGCTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 12 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CGACTTTGCCTTTCCATTTGTTCTGTTAAAGGCCGAAAGGGTGCTAAAGAGGAACACTGT 1260 

12 73 CCATTGGCATGGGGAAATATAAACTTGTTTGATTACACAGACACTCTAGTATCTGGAAAA 1332 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CCATTGGCCTGGGGAAATATAAACTTGTTTGATTACACAGATACTCTAGTATCTGGAAAA 132 0 

1333 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGATTAGAAGATTTGCTGAACCCTATTGGT 1392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ATGGCTTTGAATCTTTGGCCAGTACCTCATGGACTAGAAGATTTGCTGAACCCTATTGGT 1380 

1393 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGCTTAGAGTTGGAGTTTGACTGGTTC 1452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GTTACTGGATCAAATCCAAATAAAGAAACTCCATGTTTAGAGTTGGAGTTTGACTGGTTC 1440 

1453 AGCAGTGTGGTAAAGTTCCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 1512 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 AGCAGTGTGGTAAAGTTTCCAGATATGTCAGTGATTGAAGAGCATGCCAATTGGTCTGTA 15 00 

1513 TCCCGAGAAGCAGGATTTAGCTATTCCCACGCAGGACTGAGTAACAGACTAGCTAGAGAC 15 72 
I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 01 TCCCGTGAAGCAGGATTTAGTTATTCCCATGCAGGACTGAGTAACAGACTAGCTAGAGAC 156 0 

15 73 AATGAATTAAGGGAAAATGACAAAGAACAGCTCAAAGCAATTTCTACACGAGATCCTCTC 1632 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 1561 AAT G AAT T AAG AG AAAAT G AT AAAG AAC AGC T C C GAG C AAT TTGTACAC GAG AT C C T C T A 162 0 

1633 TCTGAAATCACTGAGCAGGAGAAAGATTTTCTATGGAGTCACAGACACTATTGTGTAACT 16 92 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TCTGAAATCACTGAGCAAGAGAAAGATTTTCTGTGGAGCCACAGACACTATTGTGTAACT 16 80 

16 93 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAATTCTAGAGATGAAGTA 1752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ATCCCCGAAATTCTACCCAAATTGCTTCTGTCTGTTAAATGGAACTCTAGAGATGAAGTA 1740 

1753 GCCCAGATGTATTGCTTGGTAAAAGATTGGCCTCCAATCAAACCTGAACAGGCTATGGAA 1812 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

17 41 GCTCAGATGTACTGCTTGGTAAAAGATTGGCCTCCAATCAAGCCTGAACAGGCTATGGAG 1800 

1813 CTTCTGGACTGTAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTGGAA 18 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I III 
1801 CTTCTGGACTGCAATTACCCAGATCCTATGGTTCGAGGTTTTGCTGTTCGGTGCTTAGAA 186 0 

18 73 AAATATTTAACAGATGACAAACTTTCTCAGTATTTAATTCAGCTAGTACAGGTCCTAAAA 1932 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 AAAT AT T T AAC AG AT G AC AAAC TTTCTCAGTACC T AAT TCAGCTAGTACAGGTAC T AAAA 192 0 

1933 TATGAACAATATTTGGATAACTTGCTTGTGAGATTTTTACTGAAGAAAGCATTGACTAAT 1992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I II I I I I I I 
1921 TATGAACAGTATTTGGATAACCTGCTTGTGAGATTTTTACTCAAAAAAGCGTTAACTAAT 1980 

1993 CAAAGGATTGGGCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2052 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CAAAGGATCGGTCACTTTTTCTTTTGGCATTTAAAATCTGAGATGCACAATAAAACAGTT 2040 

2 053 AGCCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGTCGTGCATGTGGGATGTATTTGAAG 2112 

II I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 AGTCAGAGGTTTGGCCTGCTTTTGGAGTCCTATTGCCGTGCATGTGGGATGTATCTGAAG 2100 

2113 CACCTGAATAGGCAAGTCGAGGCAATGGAAAAGCTCATTAACTTAACTGACATTCTCAAA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CACCTTAATAGGCAAGTTGAGGCTATGGAAAAGCTCATTAACTTGACTGACATTCTCAAA 216 0 

2173 CAGGAGAGGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGAGG 2232 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2161 CAAGAGAAGAAGGATGAAACACAAAAGGTACAGATGAAGTTTTTAGTTGAGCAAATGCGG 222 0 

2233 CGACCAGATTTCATGGATGCCCTACAGGGCTTGCTGTCTCCTCTAAACCCTGCTCATCAA 22 92 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CGACCAGATTTCATGGATGCTCTCCAGGGCTTTCTGTCTCCTCTAAACCCTGCTCATCAG 22 80 

2293 CTAGGAAACCTCAGGCTTAAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2352 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 CTGGGAAATCTCAGGCTTGAAGAGTGTCGAATTATGTCTTCTGCAAAAAGGCCACTGTGG 2340 

2353 TTGAATTGGGAGAACCCAGACATCATGTCAGAGTTACTGTTTCAGAACAATGAGATCATC 2 412 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TTGAATTGGGAGAACCCAGACATCATGTCAGAATTACTCTTTCAGAACAATGAGATCATC 2 4 00 
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Qy 2 413 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACACTTCAAATTATTCGTATTATG 2 4 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 TTTAAAAATGGGGATGATTTACGGCAAGATATGCTAACCCTTCAGATTATTCGCATTATG 2 46 0 

2473 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGTTGTCTGTCA 2532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GAAAATATCTGGCAAAATCAAGGTCTTGATCTTCGAATGTTACCTTATGGATGTCTGTCA 2520 

2533 ATCGGTGACTGTGTGGGACTTATTGAGGTGGTGCGAAATTCTCACACTATTATGCAAATT 25 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2521 ATCGGTGACTGTGTGGGACTTATCGAGGTGGTGAGAAATTCTCACACTATAATGCAGATT 25 80 

25 93 CAGTGCAAAGGCGGCTTGAAAGGTGCACTGCAGTTCAACAGCCACACACTACATCAGTGG 2652 
I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

25 81 CAGTGTAAAGGAGGCCTGAAAGGTGCACTGCAGTTTAACAGCCACACACTCCATCAGTGG 26 4 0 

2653 CTCAAAGACAAGAACAAAGGAGAAATATATGATGCAGCCATTGACCTGTTTACACGTTCA 2 712 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 

26 41 CTCAAAGACAAGAACAAGGGGGAAATATATGATGCGGCCATCGATTTGTTTACACGATCA 2 700 

2 713 TGTGCTGGATACTGTGTAGCTACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAC 2 7 72 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 7 01 TGTGCTGGATATTGTGTTGCCACCTTCATTTTGGGAATTGGAGATCGTCACAATAGTAAT 2 76 0 

2 7 73 ATCATGGTGAAAGACGATGGACAACTGTTTCATATAGATTTTGGACACTTTTTGGATCAC 2 832 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 761 ATCATGGT T AAA GAT GAT GGAC AAC T GT T T C AT AT AGAT T T T GGAC AC T T T T T G GAT C AC 2820 

2833 AAGAAGAAAAAATTTGGTTATAAACGAGAACGTGTGCCATTTGTTTTGACACAGGATTTC 2892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
2 821 AAGAAGAAAAAATTTGGTTATAAACGAGAGCGCGTGCCGTTTGTTTTGACACAAGATTTC 2880 

2 893 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2 952 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TTAATAGTGATTAGTAAAGGAGCCCAAGAATGCACAAAGACAAGAGAATTTGAGAGGTTT 2940 

2 953 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGACAGCATGCCAATCTCTTCATAAAT 3012 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 941 CAGGAGATGTGTTACAAGGCTTATCTAGCTATTCGGCAGCATGCCAATCTCTTCATAAAT 3000 

3013 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTACAATCTTTTGATGACATTGCA 30 72 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CTTTTCTCAATGATGCTTGGCTCTGGAATGCCAGAACTGCAATCTTTTGATGATATTGCA 306 0 

30 73 TACATTCGAAAGACCCTAGCCTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 3132 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3061 TACATTCGAAAGACCCTAGCTTTAGATAAAACTGAGCAAGAGGCTTTGGAGTATTTCATG 312 0 

3133 AAACAAATGAATGATGCACATCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3192 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 AAACAAATGAATGATGCACACCATGGTGGCTGGACAACAAAAATGGATTGGATCTTCCAC 3180 

3193 ACAATTAAACAGCATGCATTGAACTGA 3219 
I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 3181 ACAATTAAGCAGCATGCTTTGAACTGA 3207 
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Job time : 577.659 sees 
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